import pandas as pd


def data_preprocessing(path):
    """
    对给定路径的CSV数据进行预处理。

    本函数读取指定路径的CSV文件，对数据进行时间格式化、排序和去重操作，
    以确保数据的准确性和后续处理的便利性。
    参数:
        - path: CSV文件的路径。（训练集中传入的路径）
    返回:
        - 预处理后的DataFrame对象。
    """
    # 1.获取数据源
    data = pd.read_csv(path)

    # # 2.时间格式化，确保时间数据的一致性和可读性
    # data['time'] = pd.to_datetime(data['time']).dt.strftime('%Y-%m-%d %H:%M:%S')
    #
    # # 3.按时间排序，为时间序列分析做准备
    # data.sort_values(by='time', inplace=True)

    # 4.去除重复数据，提高数据质量
    # data.drop_duplicates(inplace=True)

    # 返回预处理后的数据，传回到训练的代码中的self.data_source变量中
    return data
